Reasoning Model

日本語訳のせいでややこしい

現在主な実装は隠れた(単純に<think>タグで囲ってUI上そこを折りたたんだだけだが…)連鎖思考で考えて、答えのみ返す(これも<Answer>タグで囲ったただの出力だが…)形が主流。(なので人間がAIの考えてることを覗いて読むことができる)

OpenAI o1も思考部分のテキストが一応展開できたりしたのでこの形だと思われるが詳細は不明(何もオープンじゃないので…)

この形式が大流行したのはだいたいDeepSeek-R1がMITライセンスで公開されたからが大きいだろう。

QwQ-32B-Previewなど考えてることをそのまま垂れ流すタイプもいるmorisoba65536.icon

始めに採用したのは確認できた範囲でClaude 3のようだ。

当時はプロンプトエンジニアリングの一種として使われたようだ

その頃はReasoningって言われてましたっけ?wogikaze.icon

Reflection-Llama-3.1-70Bは<think>タグを使っている

Claude 2 https://aws.amazon.com/jp/bedrock/faqs/基盤モデルを使用した生成系 AI アプリケーションの構築 – Amazon Bedrock に関するよくある質問 – AWS

<thinking>タグでCoTしている

元々Let's think Step by StepでCoTが流行り、その内容を<think>で囲った感じなのでどこからがReasoning Modelかと言われると微妙

Modelに出力形式を学習させていれば..?

サービスなら思考ボタンがあるoシリーズとGemini Think, DeepSeekぐらいかな～とwogikaze.icon